EXCELユーザーのためのAlteryx入門 (3).数式&計算式編 #alteryx
EXCELユーザーがAlteryxを使うための"入門編的エントリ"としてトピック別にその内容をご紹介するシリーズ「EXCELユーザーのためのAlteryx入門」。当エントリでは「データクレンジング編」としてデータの整形・不要なデータを加工の過程で削ぎ落とす際に使えそうなトピックについてご紹介して行きたいと思います。
目次
IF構文
EXCELの場合
EXCELでIF構文を扱う場合、最も一般的であるのは以下のような形で任意の条件式を作成し、条件に合致する値を割り出す...というようなケースでしょうか。
=IF(R2>2000, "High", IF(R2>500, "Medium", "Low"))
Alteryxの場合
AlteryxでIF構文の式を実現したい場合、「Formula Tool」を使う事でやりたい事を置き換える事が可能です。
IF [Sales] > 2000 THEN "High" ELSEIF [Sales] > 500 && [Sales] < 1999 THEN "Medium" ELSE "Low" ENDIF
値の集計(合計値)
EXCELの場合
任意の範囲の「値の集計(合算値の算出)」を行う場合、EXCELでは画面メニューのAutoSumシンボルをクリックする事で値を算出するか、
SUM関数を用いて値を算出する必要があります。
Alteryxの場合
Alteryxで集計を行いたい場合、「Summarize Tool」というツールが利用出来ます。
既存のデータとは別の形で情報を作成する形となりますが、以下のような形で入力に対してSummarizeの処理を仕掛け、その結果を「集計済のデータソース」として作成する形となります。ここでは上記EXCELの計算式とは若干異なりますが、「Product Name」毎の「Salesの合計値」を出してみる事にしました。
実行結果を確認してみます。ちゃんと売上の数値が合算されていました!
今回のケースでは合計値(SUM)を算出してみましたが、このツールではその他にも色々な集計が行えます。
行の累計を計算する
EXCELの場合
「行の累計を計算」するケースです。ここでは以下の様に1行に各月の数値が入っており、一行の中でその合算値を出しつつ、その合算値を行毎に累計値として積み上げていく...というものです。EXCELの場合だと各月の合算値(Total)を1つ前の行の累計値(cumulative sales)に足し込む事で実現しています。
Alteryxの場合
Alteryxで同様の処理を行うには「Multi-Row Formula Tool」が適しています。
このツールは複数行にまたがる処理を行わせたい時に便利です。
「入力ファイルに対してどのような処理を行うか」をこのツールを使って指定します。EXCEL同様の条件「1行前の累計値(cumulative sales)」に「1行毎の合計値(total)」を加算させています。
変数の一覧を見ると、以下のような形で色々なバリエーションで変数が定義されているのが確認出来ます。
こちらは「1行前の」項目一覧。
そしてこちらが「当該行」の項目一覧。
その他「定数」では以下のような要素が利用可能です。
処理実行後の出力ファイル。Alteryxで生成した新規列(cumulative_of_sales)に、EXCELで処理したものと同じ結果が出力されている事が確認出来ました。
合計のパーセンテージを計算する
EXCELの場合
EXCELの合計に基づいた各フィールドのパーセンテージを計算するには、まずデータの表を作成し、その上でデータに基づいたピボットテーブルを作成する必要があります。また、もう1つの方法はSUMIF()ステートメントを作成して各月と金額のパーセンテージを計算する方法です。
Alteryxの場合
マルチフィールド数式ツール(Multi Field Formula Tool)を使うと、複数のフィールドで1つの関数を簡単に実行出来ます。以下例では各月のパーセンテージを表示するデータ内に新しい列/フィールドを作成します。
入力データとして、以下のような形でピボットテーブルの情報を用意。
「Multi Field Formula Tool」を使い、以下のようなワークフローを作成し、実行する事で...
別項目としてパーセンテージを算出する事が出来ました。
行のグループ化と集計
EXCELの場合
EXCELでデータを要約したい場合はピボットテーブルを活用出来ます。
Alteryxの場合
同様の事をAlteryxで実現したい場合は「Summarize Tool」が有効です。以下のような設定を使ってIn/Outのデータソースを設定しておくと、
出力結果として以下のようなデータを生成する事が出来ます。
まとめ
という訳で「EXCELユーザーのためのAlteryx入門」第3弾、「数式&計算式編」としてEXCELで扱える計算式や数式に関する作業の"Alteryx化"への道筋を概略の形ではありますが紹介したエントリでした。この他にも出来ることはまだまだ沢山ありますので折を見て詳細な内容についてもご紹介出来ればと思います。
参考情報:
日本初のAlteryxビジネスパートナーであるクラスメソッドが、Alteryxの導入から活用方法までサポートします。14日間の無料トライアルも実施中ですので、お気軽にご相談ください。